5 research outputs found

    Improving DNA Barcode-based Fish Identification System on Imbalanced Data using SMOTE

    Get PDF
    Problem in imbalanced data is very common in classification or identification. The problem is raised when the number of instances of one class far exceeds the other. In the previous research, our DNA barcode-based Identification System of Tuna and Mackerel was developed in imbalanced dataset. The number of samples of Tuna and Mackerel were much more than those of other fish samples. Therefore, the accuracy of the classification model was probably still in bias. This research aimed at employing Synthetic Minority Oversampling Technique (SMOTE) to yield balanced dataset. We used k-mers frequencies from DNA barcode sequences as features and Support Vector Machine (SVM) as classification method. In this research we used trinucleotide (3-mers) and tetranucleotide (4-mers). The training dataset was taken from Barcode of Life Database (BOLD). For evaluating the model, we compared the accuracy of model using SMOTE and without SMOTE in order to classify DNA barcode sequences which is taken from Department of Aquatic Product Technology, Bogor Agricultural University. The results showed that the accuracy of the model in the species level using SMOTE was 7% and 13% higher than those of non-SMOTE for trinucleotide (3-mers) and tetranucleotide (4-mers), respectively. It is expected that the use of SMOTE, as one of data balancing technique, could increase the accuracy of DNA barcode based fish classification system, particularly in the species level which is difficult to be identified

    Model Spasial untuk Prediksi Konsentrasi Polutan Kabut Asap Kebakaran Lahan Gambut Menggunakan Support Vector Regression

    Get PDF
    Kabut asap dari kebakaran lahan gambut mengandung berbagai macam polutan seperti CO dan CO2. Polutan tersebut dapat berimplikasi buruk pada kesehatan masyarakat sekitar peristiwa itu terjadi yang berupa Infeksi Saluran Pernafasan Atas (ISPA). Penelitian ini bertujuan untuk membuat model spasial untuk prediksi konsentrasi polutan kabut asap yang berupa CO dan CO2 dari kebakaran lahan gambut di Sumatra tahun 2015. Model spasial dibentuk menggunakan algoritme support vector regression (SVR) dengan kernel radial basis function (RBF) dengan melihat konsentrasi polutan dari beberapa titik tetangga. Parameter tuning dilakukan untuk mendapatkan nilai parameter paling optimal dari SVR. Hasil penelitian menunjukkan bahwa model spasial prediksi konsentrasi CO terbaik didapatkan pada gamma dengan nilai 20 yang menghasilkan root mean squared error (RMSE) dan nilai koefisien korelasi sebesar 1,174242×10-8 dan 0,5879287. Model spasial prediksi konsentrasi CO2 terbaik dibentuk pada gamma dengan nilai 10 yang  menghasilkan RMSE dan nilai koefisien korelasi sebesar 9,843717×10-8 dan 0,6058418. Hasil prediksi dari model yang dibentuk telah dapat mengikuti pola nilai aktual konsentrasi polutan.Kata Kunci: CO, CO2, kabut asap, model spasial, support vector regression

    Pemodelan Berbasis Jaringan untuk Pengklasifikasian Kanker Payudara Berdasarkan Data Molekuler

    Get PDF
    Cancer is a disease characterized by uncontrolled cell growth. One of the characteristics of uncontrolled growth is the presence of estrogen-receptor-positive (ER+). About 67% of breast cancer test results have ER+. Breast cancer profiles are divided into 4 subtypes, namely: Luminal A, Luminal B, basal-like, and HER-2 enriched. Each category has a different effect on adjuvant chemotherapy. In this study, a network-based approach was used to select features/molecular biomarkers that have the potential to assist modeling and classifying sub-types of breast cancer. The molecular features used are Copy Number Alteration (CNA) and gene expression. The feature selection results were compared with the PAM50 feature-based accuracy from the literature study. The results indicate that the features selected from this network-based approach can obtain a comparable performance w.r.t the original PAM50 features, and can be used as alternative to perform breast cancer subtyping.Kanker merupakan penyakit yang ditandai dengan pertumbuhan sel yang tidak terkendali. Salah satu ciri dari adanya sel yang tumbuh tidak terkendali adalah adanya estrogen-reseptor-positif (ER+). Sekitar 67% hasil tes kanker payudara memiliki ER+. Profil kanker payudara dibagi menjadi 4 sub-tipe yaitu: Luminal A, Luminal B, basal-like, dan HER-2 enriched. Masing-masing kategori memiliki pengaruh yang berbeda terhadap kemoterapi adjuvant. Pada penelitian ini, digunakan pendekatan berbasis jaringan (network) untuk melakukan pemilihan fitur/biomarker molekuler yang berpotensi untuk membantu pemodelan dan klasifikasi sub-tipe kanker payudara. Fitur molekuler yang digunakan yaitu Copy Number Alteration (CNA) dan ekspresi gen. Hasil pemilihan fitur tersebut dibandingkan dengan akurasi berbasis fitur PAM50 dari studi literatur. Dari hasil penelitian didapatkan bahwa fitur dari metode seleksi berbasis jaringan ini mampu menghasilkan performa yang sebanding dengan fitur PAM50 dan dapat menjadi alternatif untuk melakukan klasifikasi jenis kanker payudara

    Prediksi Harga Minyak Goreng Curah dan Kemasan Menggunakan Algoritme Long Short-Term Memory (LSTM)

    No full text
    A very significant increase in the price of basic necessities will affect the economy of the Indonesian people, such as lowering purchasing power. Based on the monitoring of the Strategic Food Price Information Center from November 2021 to August 2022, cooking oil is a necessities that experienced a very significant increase of price in Indonesia. This increase was spread evenly across 34 provinces of Indonesia, including the province of West Java. This significant increase can be prevented by taking preventive actions before, if this increase has been predicted. Deep Learning is a supervised learning method that is widely used today because of its reliability in solving various problems in the field of data mining. Deep learning can predict future cooking oil prices using time series data. This study develops a model to predict the price of cooking oil in bulk and packaged form using deep learning that specifically manages time series data, namely Long Short Term Memory (LSTM). Based on the NRMSE evaluation metric, the model built is able to recognize the price fluctuation of cooking oil in the form of bulk and packaging. The NRMSE value of the LSTM model in the training process is 0.019 for bulk cooking oil data training, and 0.037 for packaged cooking oil data.Kenaikan harga bahan kebutuhan pokok yang sangat signifikan akan menimbulkan dampak negatif bagi perekonomian masyarakat Indonesia, salah satunya adalah penurunan daya beli. Berdasarkan monitor Pusat Informasi Harga Pangan Strategis dari November 2021 hingga Agustus 2022, minyak goreng merupakan salah satu bahan pokok yang mengalami kenaikan harga yang sangat signifikan di. Kenaikan ini tersebar merata di 34 provinsi Indonesia, termasuk provinsi Jawa Barat. Kenaikan yang signifikan ini dapat dicegah dengan melakukan tindakan preventif jauh hari sebelumnya, jika kenaikan ini telah diprediksi sebelumnya. Deep Learning merupakan metode supervised learning yang banyak digunakan saat ini karena kehandalannya untuk menyelesaikan berbagai masalah di bidang penambangan data. Deep learning dapat melakukan prediksi harga minyak goreng untuk masa yang akan datang menggunakan data deret waktu. Penelitian ini mengembangkan model untuk memprediksi harga minyak goreng berbentuk curah maupun kemasan menggunakan deep learning yang khusus mengelola data time serires yaitu Long Short Term Memory (LSTM). Berdasarkan metrik evaluasi NRMSE, model yang dibangun mampu mengenali pola harga minyak goreng berbentuk curah maupun kemasan. Nilai NRMSE model LSTM pada proses pelatihan adalah 0.019 untuk pelatihan data minyak goreng curah, dan 0.037 untuk data minyak goreng kemasan

    Prediksi Harga Minyak Goreng Curah dan Kemasan Menggunakan Algoritme Long Short-Term Memory (LSTM)

    No full text
    A very significant increase in the price of basic necessities will affect the economy of the Indonesian people, such as lowering purchasing power. Based on the monitoring of the Strategic Food Price Information Center from November 2021 to August 2022, cooking oil is a necessities that experienced a very significant increase of price in Indonesia. This increase was spread evenly across 34 provinces of Indonesia, including the province of West Java. This significant increase can be prevented by taking preventive actions before, if this increase has been predicted. Deep Learning is a supervised learning method that is widely used today because of its reliability in solving various problems in the field of data mining. Deep learning can predict future cooking oil prices using time series data. This study develops a model to predict the price of cooking oil in bulk and packaged form using deep learning that specifically manages time series data, namely Long Short Term Memory (LSTM). Based on the NRMSE evaluation metric, the model built is able to recognize the price fluctuation of cooking oil in the form of bulk and packaging. The NRMSE value of the LSTM model in the training process is 0.019 for bulk cooking oil data training, and 0.037 for packaged cooking oil data.Kenaikan harga bahan kebutuhan pokok yang sangat signifikan akan menimbulkan dampak negatif bagi perekonomian masyarakat Indonesia, salah satunya adalah penurunan daya beli. Berdasarkan monitor Pusat Informasi Harga Pangan Strategis dari November 2021 hingga Agustus 2022, minyak goreng merupakan salah satu bahan pokok yang mengalami kenaikan harga yang sangat signifikan di. Kenaikan ini tersebar merata di 34 provinsi Indonesia, termasuk provinsi Jawa Barat. Kenaikan yang signifikan ini dapat dicegah dengan melakukan tindakan preventif jauh hari sebelumnya, jika kenaikan ini telah diprediksi sebelumnya. Deep Learning merupakan metode supervised learning yang banyak digunakan saat ini karena kehandalannya untuk menyelesaikan berbagai masalah di bidang penambangan data. Deep learning dapat melakukan prediksi harga minyak goreng untuk masa yang akan datang menggunakan data deret waktu. Penelitian ini mengembangkan model untuk memprediksi harga minyak goreng berbentuk curah maupun kemasan menggunakan deep learning yang khusus mengelola data time serires yaitu Long Short Term Memory (LSTM). Berdasarkan metrik evaluasi NRMSE, model yang dibangun mampu mengenali pola harga minyak goreng berbentuk curah maupun kemasan. Nilai NRMSE model LSTM pada proses pelatihan adalah 0.019 untuk pelatihan data minyak goreng curah, dan 0.037 untuk data minyak goreng kemasan
    corecore